Fecha de publicación

22 de octubre de 2024


Antes de empezar el curso

  • Asegurese de instalar los paquetes necesarios para el curso detallados aqui.

Día 1

Introducción a R (Parte I) tutorial

  • Introducción al aprendizaje estadístico
  • Instalación de R y RStudio
  • Navegación en el entorno de RStudio
  • Estructuras de datos básicas: vectores, matrices y listas
  • Operaciones básicas y funciones en R

Recursos adicionales

Día 2

Introducción a R (Parte II) tutorial

  • Manejo de data frames y matrices
  • Filtrado, ordenamiento y resumen de datos
  • Visualización básica de datos con gráficos base
  • Creación de gráficos personalizados

Día 3

Simulación de Datos con Patrones Predefinidostutorial

  • Introducción a la simulación de datos y su importancia
  • Generación de datos con distribuciones específicas (normal, uniforme, etc.)
  • Creación de datos con correlaciones y estructuras de dependencia
  • Generación de datos categóricos y con ruido controlado

Recursos adicionales

Tarea 1

Fecha de entrega: 10 de septiembre

Deben subir a mediación virtual el código con las respuestas en un archivo .R, .Rmd o .qmd

  1. Genere un conjunto de datos con 100 observaciones y 5 variables, donde una de ellas sea una variable categórica con 3 niveles. Cada variable cuantitativa debe ser generada con una distriución diferente (e.g. normal,log-normal, gamma, etc)

  2. Cree 100 replicas aleatorias del conjunto de datos del punto 1.

Pista:

Código
replicate(n = 3, expr = {
  v1 <- sample(letters, 2)
  v2 <- runif(3)
  l1 <- list(v1, v2)
},
simplify = FALSE)

Día 4

Regresión lineal simple tutorial

  • Conceptos básicos de regresión lineal simple
  • Ajuste de modelos y interpretación de coeficientes
  • Evaluación del modelo: R² y error cuadrático medio (MSE)
  • Diagnóstico de supuestos y multicolinealidad
  • Tamaño de muestra y poder estadístico

Día 5

Regresión Múltiple e Interacciones tutorial

  • Introducción a la regresión múltiple
  • Modelado con variables categóricas mediante variables ficticias
  • Interacciones entre variables y su interpretación
  • Evaluación y diagnóstico de modelos avanzados

Día 6

Regresión Logística tutorial

  • Introducción a la clasificación y problemas de clasificación
  • Regresión logística, uso e interpretación
  • Predicciones a partir de un modelo
  • Regresión multinomial
  • Análisis de función discriminante

Recursos adicionales

Tarea 2

  1. Investigue el efecto del tamaño de muestra en la estimación de parámetros de un modelo de regresión lineal simple. ¿Qué sucede con la precisión de los coeficientes a medida que aumenta el tamaño de muestra?. Genere gŕaficos de tamano de muestra (de 5 a 100 observaciones) vs. la distancia entre coeficientes estimados y simulados y explique sus observaciones.

  2. Investigue el efecto de la multicolinealidad en la estimación de parámetros de un modelo de regresión lineal múltiple. ¿Qué sucede con la precisión de los coeficientes a medida que aumenta la correlación entre variables?. Genere gŕaficos de correlación (de 0 a 0.9) vs. la distancia entre coeficientes estimados y simulados y explique sus observaciones.

  3. Haga el mismo ejercicio para un modelo de regresión logística y evalúe el efecto de la multicolinealidad en la estimación de coeficientes y la precisión del modelo.

Día 7

Métodos de Remuestreo y Evaluación de Modelos (Parte I) tutorial

  • Validación cruzada y técnicas de remuestreo
  • Uso de validación cruzada para evaluar modelos
  • Medidas de evaluación: matriz de confusión, precisión, recall, índice F1

Día 8

Evaluación de Modelos (Parte II) tutorial

  • Validación cruzada y división de conjuntos de datos
  • Curvas ROC y AUC: interpretación y uso
  • Análisis de errores y ajuste de modelos
  • Comparación y selección de modelos

Día 9

Métodos Basados en Árboles tutorial

  • Árboles de decisión: construcción e interpretación
  • Random forest: fundamentos y aplicaciones
  • Evaluación de modelos de árboles y comparación con otros métodos

Recursos adicionales

Día 10

Explorar Espacios Multidimensionales: Reducción de Dimensionalidad tutorial

  • Introducción a la reducción de dimensionalidad y su necesidad
  • Análisis de Componentes Principales (PCA): teoría y aplicación
  • Visualización de datos en espacios reducidos
  • Comparación con otros métodos como t-SNE

Tarea 3

Por definir

Recursos adicionales

Día 11

Redes Neuronales y Deep Learning (Parte I) tutorial

  • Estructura de una red neuronal: neuronas, capas y activación
  • Entrenamiento de redes neuronales: forward y backpropagation
  • Introducción a Deep Learning y redes neuronales profundas
  • Aplicaciones y casos de uso en el mundo real

Día 12

Redes Neuronales y Deep Learning (Parte II) tutorial

  • Capas convolucionales y redes neuronales convolucionales (CNNs)
  • Redes neuronales recurrentes (RNNs) y LSTM
  • Técnicas de optimización y regularización
  • Casos de estudio y aplicaciones en visión por computadora y procesamiento de lenguaje natural

Recursos adicionales

Día 13

Regularización y Generalización tutorial

  • Conceptos de sobreajuste y subajuste
  • Regularización: Lasso, Ridge y Elastic Net
  • Validación cruzada y selección de hiperparámetros
  • Impacto de la regularización en el aprendizaje estadístico

Día 14

Aprendizaje No Supervisado: Clustering tutorial

  • Conceptos básicos de clustering y su importancia
  • Método k-means: algoritmos y aplicaciones
  • Clustering jerárquico: construcción de dendrogramas
  • Evaluación de clusters: índice de Silhouette y coeficiente de Rand

Recursos adicionales